AI TNT— 让一部分先用AI实现商业化

MoE再下一城！港大提出AnyGraph：首次开启「图大模型」Scaling Law之路

AnyGraph聚焦于解决图数据的核心难题，跨越多种场景、特征和数据集进行预训练。其采用混合专家模型和特征统一方法处理结构和特征异质性，通过轻量化路由机制和高效设计提升快速适应能力，且在泛化能力上符合Scaling Law。

来自主题: AI技术研报

7418 点击 2024-09-02 16:35

从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方法会大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。

来自主题: AI资讯

6808 点击 2024-08-31 11:19

港大黄超团队推出AnyGraph, 首次揭秘图大模型的Scaling Law

本文的主要作者来自香港大学的数据智能实验室 (Data Intelligence Lab@HKU)。

来自主题: AI技术研报

6982 点击 2024-08-29 17:05

「C位观察」数据流动的艺术：构建AI时代的高速通信网络

为了实现算力层面的提升和追赶，国内有大量的厂商和从业者在各个产业链环节努力。但面对中短期内架构、制程、产能、出口禁令等多方面的制约，我们认为从芯片层面实现单点的突破依旧是非常困难且不足的。

来自主题: AI技术研报

5686 点击 2024-08-23 15:10

C.AI被收购的宿命论与万恶的Scaling Law

C.AI被收购是因市场和创始人选择，Scaling Law加剧了竞争。 • C.AI选择做模型公司以获得高估值。 • Google收购C.AI以应对AI市场竞争。 • Scaling Law使大模型公司竞争更激烈。

来自主题: AI资讯

5331 点击 2024-08-19 10:02

Nature子刊 | 基于内生复杂性，自动化所新类脑网络构筑人工智能与神经科科学的桥梁

让模型具有更加广泛和通用的认知能力，是当前人工智能（AI）领域发展的重要目标。目前流行的大模型路径是基于 Scaling Law (尺度定律) 去构建更大、更深和更宽的神经网络提升模型的表现，可称之为 “基于外生复杂性” 的通用智能实现方法。然而，这一路径也面临着一些难以克服的困境，例如高昂的计算资源消耗和能源消耗，并且在可解释性方面存在不足。

来自主题: AI资讯

4777 点击 2024-08-18 10:16